En este cuaderno vamos a procesar un conjunto de datos para posteriormente realizar un Análisis Factorial a partir de los microdatos del informe PISA(informe del Programa para la Evaluación Internacional de los Estudiantes) en España en el año 2018.

Para ello, usaremos datos de la prueba PISA del año 2018 que pueden descargarse en el siguiente link: https://www.educacionyfp.gob.es/inee/bases-datos/evaluaciones-internacionales/pisa.html. Se pueden descargar en el siguiente link en formato SPSS o SAS y nosotros transformaremos a un excel los que nos interesan.

Tomamos el fichero “Datos_PISA_ESP.csv”

Específicamente, estos datos proceden del Cuestionario de contexto del alumno, cuestionario que deben rellenar todos los alumnos que pasan PISA y que trata de medir la existencia de variables socioeconómicas, metacognitivas, motivacionales e, incluso, emocionales, que pueden tener impacto sobre el rendimiento académico. Entre las variables relacionadas con la motivación podemos encontrar:

La afición por la lectura.
La actitud hacia la Educación.
La competitividad.
La perseverancia.
El miedo al fracaso.
La autoeficacia.
La orientación a metas de aproximación a la maestría.

Pero, para simplificar más las cosas y no trabajar con un número considerable de factores, nos vamos a centrar simplemente en tres: la competitividad, la perseverancia y el miedo al fracaso.

Los items (preguntas) que miden respectivamente la competitividad, al perseverancia y el miedo al fracaso de los estudiantes son:

¿Hasta qué punto estás de acuerdo con las siguientes afirmaciones sobre ti mismo?

ST181Q02HA: Disfruto trabajando en situaciones que requieren competir con los demás.
ST181Q03HA: Es importante para mí hacerlo mejor que los demás al realizar una tarea.
ST181Q04HA: Me esfuerzo mucho cuando estoy compitiendo contra los demás.

¿Hasta qué punto estás de acuerdo con las siguientes afirmaciones sobre ti mismo?

ST182Q03HA: Me siento satisfecho cuando me esfuerzo todo lo que puedo.
ST182Q04HA: Cuando inicio una tarea continúo hasta terminarla.
ST182Q05HA: Cuando hago algo, parte de mi satisfacción se debe a que he mejorado mis resultados anteriores.
ST182Q06HA: Si algo no se me da bien, prefiero seguir esforzándome para mejorar, en lugar de hacer otra cosa que sí se me da bien.

¿Hasta qué punto estás de acuerdo con las siguientes afirmaciones?

ST183Q01HA: Cuando me he equivocado, me preocupa lo que otras personas piesen de mí.
ST183Q02HA: Cuando me he equivocado, me preocupa no tener el talento suficiente.
ST183Q03HA: Cuando me he equivocado, dudo sobre mis planes para el futuro.

La escala de respuesta para estos tres conjuntos de ítems es la misma: 1 - Totalmente en desacuerdo, 2 - En desacuerdo, 3 - De acuerdo y 4 - Totalmente de acuerdo.

Procesamos el dataset para adaptarlo a lo de arriba

# Librería tratamiento dataframes
library(dplyr)


# Microdatos
# Fichero Personas
datos <- read.csv("/Users/davpero/Downloads/Datos_PISA_ESP.csv", sep=";", dec=",")
#Este csv esta separado por ; y los decimales son ,
dim(datos) #Tenemos 35943 observaciones y 37 columnas
head(datos)

#Vamos a extraer simplemente las columnas de identificador del alumno y las de los items que nos interesan (los que miden la competitividad, la perseverancia y el miedo al fracaso):
datos <- datos[,c("CNTSTUID", "ST181Q02HA", "ST181Q03HA", "ST181Q04HA", "ST182Q03HA", "ST182Q04HA", "ST182Q05HA", "ST182Q06HA", "ST183Q01HA", "ST183Q02HA", "ST183Q03HA")]

# Creamos excel con datos
library("writexl")
write_xlsx(datos, "../../../../files/pisa_factorial.xlsx")

Este dataset será el que se proporcione para el estudiante para hacer sus análisis. pisa_factorial.xlsx